Giải trình tự gen là gì? Các công bố khoa học về Giải trình tự gen

Tự gen (tự sinh) là một khái niệm trong lĩnh vực trí tuệ nhân tạo, đề cập đến khả năng của hệ thống máy tính tự động tạo ra, sáng tạo mới những thông tin, nội d...

Tự gen (tự sinh) là một khái niệm trong lĩnh vực trí tuệ nhân tạo, đề cập đến khả năng của hệ thống máy tính tự động tạo ra, sáng tạo mới những thông tin, nội dung hoặc dữ liệu. Tự gen sử dụng các thuật toán và công nghệ phức tạp để phân tích, tổ chức và tạo ra các đối tượng mới một cách tự động mà không cần sự tương tác hoặc hướng dẫn của con người.

Tự gen có thể được áp dụng trong nhiều lĩnh vực khác nhau như văn bản tự động, nhạc tự động, hình ảnh tự động, video tự động và nhiều lĩnh vực khác. Đối với mỗi lĩnh vực, hệ thống tự gen sẽ được huấn luyện thông qua việc phân tích và học từ dữ liệu đã có sẵn, sau đó tạo ra những đầu ra mới phù hợp với yêu cầu và tiêu chuẩn được đặt ra.

Tuy nhiên, việc sử dụng tự gen cũng đặt ra một số vấn đề và thách thức. Đôi khi, hệ thống tự gen có thể tạo ra những đầu ra thiếu sáng tạo, lặp đi lặp lại hoặc không đáp ứng những yêu cầu chính xác. Do đó, việc cân nhắc và kiểm soát kỹ thuật là cần thiết để đảm bảo chất lượng và tính sáng tạo trong quá trình tự gen.
Trong lĩnh vực của nghệ thuật sáng tạo tự động, tự gen sử dụng các thuật toán và mô hình học máy để tạo ra những tác phẩm mới hoàn toàn tự động. Ví dụ, trong ngành thơ, hệ thống tự gen có thể tạo ra những bài thơ mới với các cấu trúc và ý tưởng hoàn toàn mới.

Cách thức hoạt động của hệ thống tự gen bắt đầu bằng việc huấn luyện sử dụng dữ liệu mẫu, có thể là các tác phẩm nghệ thuật đã tồn tại hoặc các bộ dữ liệu tương ứng. Hệ thống tự gen phân tích và học từ dữ liệu này để hiểu cấu trúc, quy tắc và yếu tố sáng tạo của tác phẩm. Sau khi được huấn luyện đầy đủ, hệ thống tự gen có thể tạo ra những tác phẩm mới dựa trên kiến thức đã học.

Việc tạo ra các tác phẩm tự gen có thể không chỉ xảy ra trong ngành nghệ thuật. Ví dụ, trong lĩnh vực viết bài, hệ thống tự gen có thể tạo ra những bài viết tự động dựa trên một số yêu cầu cụ thể. Điều này có thể hỗ trợ cung cấp nội dung nhanh chóng và giúp tăng khả năng đáp ứng nhu cầu đa dạng của người dùng.

Tuy nhiên, sự tự động hóa và sáng tạo của tự gen đang đặt ra một số thách thức. Việc đảm bảo tính sáng tạo, độc đáo và chất lượng của các tác phẩm tự gen vẫn là một vấn đề phức tạp. Đồng thời, cũng cần xem xét vấn đề về bản quyền và sự đạo ý trong tác phẩm tự động.

Danh sách công bố khoa học về chủ đề "giải trình tự gen":

Bộ công cụ phân tích bộ gen: Một khung MapReduce cho việc phân tích dữ liệu giải trình tự DNA thế hệ tiếp theo Dịch bởi AI
Genome Research - Tập 20 Số 9 - Trang 1297-1303 - 2010

Các dự án giải trình tự DNA thế hệ tiếp theo (NGS), chẳng hạn như Dự án Bộ Gen 1000, đã và đang cách mạng hóa sự hiểu biết của chúng ta về sự biến dị di truyền giữa các cá nhân. Tuy nhiên, các tập dữ liệu khổng lồ được tạo ra bởi NGS—chỉ riêng dự án thí điểm Bộ Gen 1000 đã bao gồm gần năm terabase—làm cho việc viết các công cụ phân tích giàu tính năng, hiệu quả và đáng tin cậy trở nên khó khăn ngay cả đối với những cá nhân có kiến thức tính toán phức tạp. Thực tế, nhiều chuyên gia gặp phải giới hạn về quy mô và sự dễ dàng trong việc trả lời các câu hỏi khoa học bởi sự phức tạp trong việc truy cập và xử lý dữ liệu do những máy này tạo ra. Trong bài báo này, chúng tôi thảo luận về Bộ công cụ Phân tích Bộ Gen (GATK) của chúng tôi, một khung lập trình có cấu trúc được thiết kế để tạo điều kiện thuận lợi cho sự phát triển của các công cụ phân tích hiệu quả và đáng tin cậy dành cho các máy giải trình tự DNA thế hệ tiếp theo sử dụng triết lý lập trình hàm MapReduce. GATK cung cấp một bộ mẫu truy cập dữ liệu nhỏ nhưng phong phú, bao trùm hầu hết các nhu cầu của công cụ phân tích. Việc tách biệt các tính toán phân tích cụ thể khỏi hạ tầng quản lý dữ liệu chung cho phép chúng tôi tối ưu hóa khung GATK về độ chính xác, độ ổn định, và hiệu quả CPU và bộ nhớ, cũng như cho phép phân giải song song bộ nhớ chia sẻ và phân tán. Chúng tôi nhấn mạnh các khả năng của GATK bằng cách mô tả việc triển khai và ứng dụng các công cụ đáng tin cậy và dung nạp quy mô như máy tính phủ và gọi đa hình đơn nucleotide (SNP). Chúng tôi kết luận rằng khung lập trình GATK cho phép các nhà phát triển và nhà phân tích nhanh chóng và dễ dàng viết các công cụ NGS hiệu quả và đáng tin cậy, nhiều công cụ trong số đó đã được tích hợp vào các dự án giải trình tự quy mô lớn như Dự án Bộ Gen 1000 và Atlas Bộ Gen Ung thư.

#khoa học #giải trình tự DNA #Bộ Gen 1000 #GATK #MapReduce #phân tích bộ gen #sự biến dị di truyền #công cụ NGS #phân giải song song #SNP #Atlas Bộ Gen Ung thư
Giải trình tự thế hệ mới trong chẩn đoán metagenomic lâm sàng để phát hiện tác nhân gây bệnh Dịch bởi AI
Annual Review of Pathology: Mechanisms of Disease - Tập 14 Số 1 - Trang 319-338 - 2019

Hầu như tất cả các tác nhân gây nhiễm trùng đều chứa genome DNA hoặc RNA, điều này khiến việc giải trình tự trở thành một phương pháp hấp dẫn để phát hiện tác nhân gây bệnh. Chi phí cho giải trình tự cao thông lượng hoặc giải trình tự thế hệ tiếp theo đã giảm đi nhiều lần kể từ khi xuất hiện vào năm 2004, và nó đã nổi lên như một nền tảng công nghệ cho phép cho việc phát hiện và phân loại vi sinh vật trong các mẫu lâm sàng từ bệnh nhân. Bài đánh giá này tập trung vào việc ứng dụng giải trình tự metagenomic thế hệ tiếp theo không nhắm mục tiêu vào chẩn đoán lâm sàng các bệnh truyền nhiễm, đặc biệt trong những lĩnh vực mà các phương pháp chẩn đoán thông thường gặp phải hạn chế. Bài đánh giá bao gồm (a) các công nghệ giải trình tự thế hệ tiếp theo và các nền tảng phổ biến, (b) quy trình kiểm tra giải trình tự thế hệ tiếp theo trong phòng thí nghiệm vi sinh vật học lâm sàng, (c) phân tích tin sinh học của dữ liệu giải trình tự metagenomic thế hệ tiếp theo, (d) xác thực và sử dụng giải trình tự metagenomic thế hệ tiếp theo để chẩn đoán các bệnh truyền nhiễm, và (e) những báo cáo và nghiên cứu trường hợp quan trọng trong lĩnh vực này. Giải trình tự thế hệ tiếp theo là một công nghệ mới có hứa hẹn sẽ nâng cao khả năng của chúng ta trong việc chẩn đoán, điều tra và theo dõi các bệnh truyền nhiễm.

#giải trình tự thế hệ mới #metagenomic #chẩn đoán lâm sàng #tác nhân gây bệnh #bệnh truyền nhiễm
Xác thực các bài kiểm tra giải trình tự thế hệ tiếp theo metagenomic cho việc phát hiện bệnh nhân toàn cầu Dịch bởi AI
Archives of Pathology and Laboratory Medicine - Tập 141 Số 6 - Trang 776-786 - 2017
Ngữ cảnh.—

Giải trình tự metagenomic có thể được sử dụng để phát hiện bất kỳ tác nhân gây bệnh nào bằng cách sử dụng giải trình tự thế hệ tiếp theo (NGS) không thiên lệch, không cần khuếch đại cụ thể cho trình tự. Bằng chứng khái niệm đã được chứng minh trong các ổ dịch bệnh truyền nhiễm không rõ nguyên nhân và ở những bệnh nhân nghi ngờ nhiễm trùng nhưng có kết quả xét nghiệm âm tính với các phương pháp truyền thống. Các bài kiểm tra NGS metagenomic có tiềm năng lớn để cải thiện chẩn đoán bệnh truyền nhiễm, đặc biệt là ở những bệnh nhân có hệ miễn dịch yếu và bệnh nhân nặng.

#Giải trình tự metagenomic #phát hiện tác nhân gây bệnh #xét nghiệm NGS #bệnh truyền nhiễm #phòng thí nghiệm lâm sàng.
Tổng Quan Về Các Công Nghệ Giải Kính Cao Thông Suất Để Làm Sáng Tỏ Các Đường Đi Lệch Phân Tử Trong Bệnh Tim Mạch Dịch bởi AI
Circulation Research - Tập 112 Số 12 - Trang 1613-1623 - 2013

Các công nghệ giải trình tự cao thông suất đã trở thành thiết yếu trong các nghiên cứu về gen, epigenom và transcriptom. Mặc dù thông tin giải trình tự đã được làm sáng tỏ bằng cách sử dụng kỹ thuật giải trình tự có thông suất thấp gọi là giải trình tự Sanger, nhưng các công nghệ giải trình tự cao thông suất có khả năng giải trình tự nhiều phân tử DNA song song, cho phép hàng triệu phân tử DNA được giải trình tự cùng một lúc. Ưu điểm này cho phép giải trình tự cao thông suất được sử dụng để tạo ra các tập dữ liệu lớn, tạo ra những hiểu biết toàn diện hơn về chữ ký gen và transcriptom của các tế bào trong nhiều bệnh và giai đoạn phát triển khác nhau. Trong số các công nghệ giải trình tự cao thông suất, giải trình tự toàn bộ exome có thể được sử dụng để xác định các biến thể mới và các đột biến khác có thể là nguyên nhân của nhiều rối loạn tim mạch di truyền, trong khi giải trình tự RNA có thể được sử dụng để phân tích cách mà transcriptom thay đổi. Giải trình tự của cromatin và giải trình tự methyl hóa có thể được sử dụng để xác định các thay đổi epigenetic, trong khi giải trình tự ribosome có thể được sử dụng để xác định các bản sao mRNA nào đang được dịch mã. Trong bài tổng quan này, chúng tôi sẽ phác thảo sự khác biệt giữa các phương thức giải trình tự khác nhau và xem xét các nền tảng giải trình tự chính trên thị trường về độ sâu đọc tương đối, tốc độ và chi phí. Cuối cùng, chúng tôi sẽ thảo luận về sự phát triển của các nền tảng giải trình tự trong tương lai và cách mà các công nghệ mới này có thể cải tiến các nền tảng giải trình tự hiện tại. Cuối cùng, những công nghệ giải trình tự này sẽ là công cụ quan trọng trong việc làm rõ hơn cách mà hệ thống tim mạch phát triển và cách mà các rối loạn trong DNA và RNA có thể dẫn đến bệnh tim mạch.

#công nghệ giải trình tự cao thông suất #bệnh tim mạch #exome #RNA #epigenetic
Phản ứng phiên mã toàn bộ gen của Trichoderma reesei đối với lignocellulose bằng cách sử dụng giải trình tự RNA và so sánh với Aspergillus niger Dịch bởi AI
Springer Science and Business Media LLC - - 2013
Tóm tắtĐặt vấn đề

Phần lớn quy trình sản xuất nhiên liệu sinh học thế hệ thứ hai là quá trình phân giải enzym lignocellulose từ sinh khối thành đường có thể lên men. Nhiều loại nấm sản xuất enzym có khả năng phân giải lignocellulose và các hỗn hợp enzym từ một số loài nấm, bao gồm những loài được nghiên cứu kỹ lưỡng như Trichoderma reeseiAspergillus niger, hiện đang có sẵn trên thị trường cho quy trình này. Các hỗn hợp enzym có sẵn trên thị trường không nhất thiết đại diện cho sự đa dạng enzym mà các loại nấm tự sản xuất khi đối diện với một chất liệu lignocellulose phức tạp. Nghiên cứu đã được thực hiện để khám phá sự cảm ứng toàn cầu của các gen trong phản ứng với sự tiếp xúc của T. reesei với rơm lúa mì thông qua RNA-seq và so sánh với dữ liệu RNA-seq đã công bố cũng như mô hình cách mà A. niger cảm nhận và phản ứng với rơm lúa mì.

Kết quả

Trong T. reesei, mức độ của các phiên mã mã hóa cho các enzym phân giải thành tế bào đã biết và dự đoán rất cao sau 24 giờ tiếp xúc với rơm (khoảng 13% tổng số mRNA) nhưng thấp hơn so với A. niger (khoảng 19% tổng số mRNA). Phân tích kỹ lưỡng cho thấy rằng các enzym thuộc cùng họ hydrolase glycoside nhưng từ các họ esterase và lyase polysaccharide khác nhau đều được tăng cường trong cả hai sinh vật. Các protein phụ có thể có vai trò trong việc tăng cường phân giải carbohydrate trong A. niger cũng đã được phát hiện trong T. reesei và các loại enzym được cảm ứng nhìn chung tương tự với các enzym trong A. niger. Tương tự như A. niger, các phiên mã đối kháng có mặt trong T. reesei và sự biểu hiện của chúng được điều chỉnh bởi điều kiện sinh trưởng.

Kết luận

T. reesei sử dụng một loạt các enzym tương tự như A. niger để phân giải một chất nền lignocellulose rắn. Điều này cho thấy một chiến lược bảo tồn đối với việc phân hủy lignocellulose ở cả hai loại nấm ăn mùn. Nghiên cứu này cung cấp cơ sở cho việc phân tích và đặc trưng hóa các gen được chứng minh là có sự cảm ứng cao trong sự hiện diện của một chất nền lignocellulose. Dữ liệu sẽ giúp làm sáng tỏ cơ chế nhận diện chất nền rắn và sự phân hủy tiếp theo của T. reesei và cung cấp thông tin có thể hữu ích cho việc sản xuất hiệu quả nhiên liệu sinh học thế hệ thứ hai.

Geneious! Phương pháp lướt genom đơn giản hóa cho các nghiên cứu hệ thống học phân loại: Một nghiên cứu trường hợp ở Oreocarya (Boraginaceae) Dịch bởi AI
Applications in Plant Sciences - Tập 2 Số 12 - 2014

Cơ sở nghiên cứu: Khi những nhà hệ thống học cố gắng khai thác tốt nhất sức mạnh của giải trình tự thế hệ tiếp theo (NGS), một lượng lớn các bài tổng quan, phương pháp và công cụ phân tích khiến việc lựa chọn phương pháp phù hợp trở nên khó khăn. Oreocarya (Boraginaceae), một chi gồm 63 loài, là một ví dụ điển hình về một nhóm thiếu cả độ phân giải ở cấp loài và tài nguyên gen. Việc sử dụng Geneious loại bỏ các rào cản sinh tin học và làm cho việc lướt genom NGS trở nên dễ tiếp cận ngay cả với những nhà hệ thống học không thành thạo công nghệ nhất.

#hệ thống học #giải trình tự thế hệ tiếp theo #Geneious #lướt genom #<i>Oreocarya</i>
Tái nhiễm SARS-CoV-2 nặng với biến thể Delta sau khi hồi phục từ nhiễm trùng đột phá do biến thể Alpha ở một nhân viên y tế đã tiêm chủng đầy đủ Dịch bởi AI
Frontiers in Medicine - Tập 8

Giới thiệu: Miễn dịch sau nhiễm trùng và miễn dịch sau tiêm chủng đều cung cấp sự bảo vệ chống lại COVID-19. Tuy nhiên, đã có nhiều trường hợp tái nhiễm và nhiễm trùng đột phá được chứng minh bằng giải trình tự gen toàn bộ. Cả hai trường hợp này thường nhẹ và gây ra bởi các Biến thể Đáng lo ngại (VOC).

Phương pháp: Bệnh nhân trong nghiên cứu của chúng tôi đã trải qua xét nghiệm RT-PCR COVID-19 liên tục, xét nghiệm máu để kiểm tra huyết thanh, các chất phản ứng cấp tính và hình ảnh phổi như một phần của chăm sóc lâm sàng. Chúng tôi đã phỏng vấn bệnh nhân về lịch sử lâm sàng và thu thập các báo cáo cũng như hồ sơ bệnh án. Chúng tôi đã thu thập các mẫu dương tính RT-PCR đã được lưu trữ để thực hiện giải trình tự gen toàn bộ (WGS) SARS-CoV-2 từ các nhiễm trùng đột phá của bệnh nhân và trường hợp đầu tiên được cho là nguồn lây.

Kết quả: Bệnh nhân đã có ba nhiễm SARS-CoV-2 được xác nhận bằng RT-PCR. Hai nhiễm trùng đột phá xảy ra liên tiếp nhanh chóng, lần đầu tiên xảy ra sau hơn 3 tuần sau khi tiêm chủng hoàn thành với COVISHIELD và mặc dù đã có sự chuyển đổi huyết thanh sau tiêm chủng. Nhiễm trùng đột phá đầu tiên là do biến thể Alpha và nhiễm trùng thứ hai là do biến thể Delta. Nhiễm trùng do biến thể Delta dẫn đến tình trạng thiếu oxy, nhập viện và bệnh kéo dài bảy tuần. Xét nghiệm huyết thanh theo dõi, các chất phản ứng cấp tính và hình ảnh phổi đã hỗ trợ WGS trong việc xác định các trường hợp nhiễm trùng khác nhau. WGS xác định một thành viên trong gia đình đã tiêm chủng đầy đủ là trường hợp đầu tiên.

Giải thích: Bệnh nhân đã có một nhiễm trùng đột phá do biến thể Alpha mặc dù đã có nhiễm trùng trước đó, tiêm chủng đầy đủ và chuyển đổi huyết thanh. Mặc dù đã tiêm nhắc sau khi nhiễm trùng này, bệnh nhân sau đó đã có một nhiễm trùng đột phá nặng do biến thể Delta. Đây cũng là một trường hợp tái nhiễm được chứng minh bằng WGS và, do đó, là một trường hợp tái nhiễm do nhiễm trùng đột phá. Bệnh nhân đã nhận được nhiễm trùng từ một thành viên trong gia đình đã tiêm chủng đầy đủ.

#COVID-19 #SARS-CoV-2 #tiêm chủng #tái nhiễm #biến thể Alpha #biến thể Delta #miễn dịch #giải trình tự gen toàn bộ
Nâng cấp siêu cấu trúc và gắn chromosome để cải thiện các bộ gen Anopheles Dịch bởi AI
BMC Biology - Tập 18 Số 1 - 2020
Tóm tắt Nền tảng

Các công nghệ giải trình tự mới đã giảm bớt rào cản tài chính đối với việc giải trình tự toàn bộ gen, nhưng các bộ gen thu được thường bị phân mảnh và còn xa khỏi trạng thái ‘hoàn chỉnh’. Việc cập nhật các bản dự thảo đa cấu trúc lên trạng thái cấp nhiễm sắc thể có thể đạt được thông qua các nỗ lực lập bản đồ thực nghiệm hoặc tái giải trình tự. Để tránh chi phí liên quan đến những cách tiếp cận này, phân tích gen so sánh về sự bảo tồn thứ tự gen (sự đồng điệu) để dự đoán các đồng nghiệp cấu trúc (đối xứng) cung cấp một phương pháp bổ sung có thể hữu ích để cải thiện các bản dự thảo.

#các công nghệ giải trình tự #cấu trúc đa #công nghệ RNAseq #Anopheles #bảo tồn thứ tự gen
Giả-Sanger: sản xuất song song lớn các chuỗi dài và gần như không có lỗi sử dụng công nghệ NGS Dịch bởi AI
Springer Science and Business Media LLC - - 2013
Tóm tắtBối cảnh

Công nghệ giải trình tự thế hệ tiếp theo (NGS) thường có đặc điểm là có thông lượng cực cao nhưng độ dài đoạn đọc lại rất ngắn so với phương pháp giải trình tự Sanger truyền thống. Giải trình tự NGS hai đầu có thể mở rộng độ dài đoạn đọc một cách tính toán nhưng mang theo nhiều bất tiện thực tiễn vì khoảng trống cố hữu. Hiện nay, giải trình tự hai đầu của Illumina có khả năng đọc cả hai đầu từ các đoạn DNA dài 600 bp hoặc thậm chí 800 bp, việc lấp đầy khoảng trống giữa hai đầu để tạo ra những đoạn đọc dài chính xác là vấn đề thú vị nhưng thách thức.

Kết quả

Chúng tôi đã phát triển một công nghệ mới, gọi là giải trình tự Giả-Sanger (PS). Công nghệ này cố gắng lấp đầy các khoảng trống giữa hai đầu và có thể tạo ra các chuỗi gần như không có lỗi tương đương với độ dài của các đoạn đọc Sanger truyền thống nhưng có thông lượng cao của giải trình tự thế hệ tiếp theo. Điểm mới cốt lõi của phương pháp PS nằm ở việc lấp đầy khoảng trống dựa trên việc lắp ráp cục bộ các đoạn đọc hai đầu có trùng lặp ở bất kỳ đầu nào. Do đó, chúng tôi có thể lấp đầy các khoảng trống trong vùng gen lặp lại một cách chính xác. Giải trình tự PS bắt đầu từ các đoạn đọc ngắn từ các nền tảng NGS, sử dụng một loạt các thư viện hai đầu có kích thước chèn giảm dần từng bước. Một phương pháp tính toán được giới thiệu để biến các đoạn hai đầu đặc biệt này thành những chuỗi PS dài và gần như không có lỗi, tương ứng với các đoạn có kích thước chèn lớn nhất. Việc xây dựng PS có 3 lợi thế so với các đoạn đọc không được biến đổi: lấp đầy khoảng trống, sửa lỗi và dung lượng dị hợp. Trong số nhiều ứng dụng của việc xây dựng PS là lắp ráp bộ gen de novo, đã được chúng tôi kiểm tra trong nghiên cứu này. Lắp ráp các đoạn đọc PS từ một dòng không đồng nhất của Drosophila melanogaster tạo ra một N50 contig dài 190 kb, cải thiện gấp 5 lần so với các phương pháp lắp ráp de novo hiện có và gấp 3 lần so với lắp ráp các đoạn đọc dài từ giải trình tự 454.

Kết luận

Phương pháp của chúng tôi tạo ra các đoạn đọc dài gần như không có lỗi từ giải trình tự hai đầu NGS. Chúng tôi đã chứng minh rằng lắp ráp de novo có thể có lợi rất nhiều từ các chuỗi giống Sanger này. Ngoài ra, đặc điểm của các chuỗi dài có thể được áp dụng vào các ứng dụng như phát hiện biến đổi cấu trúc và metagenomics.

#Giải trình tự giả-Sanger #công nghệ NGS #trình tự hai đầu #lỗi tự do #lắp ráp bộ gen de novo #Drosophila melanogaster
XÂY DỰNG PROBE ĐỂ KHAI THÁC VÀ CHỌN GEN MÃ HÓA XYLAN 1-4 BETA XYLOSIDASE TỪ DỮ LIỆU GIẢI TRÌNH TỰ DNA METAGENOME
Vietnam Journal of Biotechnology - Tập 15 Số 3 - 2017
Theo phân loại của CAZy, xylan 1-4 beta xylosidase thuộc họ glycoside hydrolase (GH) 1, 3, 31, 39, 43,51, 52, 54, 116, 120. Trong nghiên cứu này, probe được xây dựng dựa trên các trình tự axit amin của enzyme này từ mỗi họ GH đã được nghiên cứu trong thực nghiệm. Các trình tự thu thập để xây dựng probe đảm bảo cùng có nguồn gốc từ vi khuẩn, có các thông tin chi tiết về hoạt tính enzyme, nhiệt độ và pH hoạt động tối ưu. Kết quả các họ GH1, GH3 chỉ tìm được duy nhất 01 trình tự, GH52 tìm được 3 trình tự và GH43 tìm được 11 trình tự đáp ứng các tiêu chí thu thập. Với kết quả tìm kiếm này, chỉ có duy nhấthọ GH43 có đủ số lượng trình tự đáng tin cậy để xây dựng probe. Probe của họ GH43 có độ dài là 507 amino acid, trong đó chứa toàn bộ 7 amino acid hoàn toàn giống nhau ở các trình tự, 32 vị trí giống nhau ở đa số các trình tự và có 30 vị trí giống nhau ở một số trình tự, với độ bao phủ thấp nhất là 60% và độ tương đồng thấp nhất là 30%, điểm tối đa là 17. Sử dụng probe này đã khai thác được 25 trình tự mã hóa xylan 1-4 beta xylosidase từ dữ liệu giải trình tự DNA metagenome của vi sinh vật sống tự do trong ruột mối. So sánh với kết quả chú giải gen dựa trên dữ liệu KEGG của BGI chỉ có 20 trình tự trùng nhau. Kết quả ước đoán cấu trúc bậc ba của các trình tự cho thấy tất cả các trình tự có chỉ số điểm tối đa khi so sánh với probe bằng BLASTP cao trên 100 đều có cấu trúc giống với cấu trúc của xylosidase đã được nghiên cứu. Như vậy, probe này có thể sử dụng để khai thác gen beta - xylosidase từ dữ liệu metagenome khi sử dụng chỉ số điểm tối đa trên 100
#BLASTP #ClustalW #Coptotermes gestroi #DNA metagenome #glycoside hydrolase (GH) #probe #xylan 1-4 beta xylosidase #Xbxs14
Tổng số: 190   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10